基于大规模手机定位数据的群体活动时空特征分析
由于智能手机的广泛使用,移动运营商通过通讯信号将基站尺度的时空位置记录下来,基于智能手机的移动定位数据为群体时空间活动特征研究提供了新的解决途径。
本文利用深圳市海量手机定位数据,通过识别用户停留位置和停·留活动、标记活动语义信息,分析用户的停留点和停留活动的分布差异,研究群体活动的时空分布模式,探讨人群活动模式的多样分布特征。这对于深入理解城市空间中不同类型活动的时空分布的多样性和差异性具有重要意义,对于辅助城市交通优化和城市规划具有参考价值。
引言
城市是动态且复杂的。城市空间不仅由土地、建筑和其他基础设施组成,也与城市内居民的活动和移动行为息息相关。城市空间与居民行为不断交互,相互影响。随着城市化和社会变革的加速,城市空间变得复杂,人群流动和活动也变得快速化和多样化。
因此,深入探究人们在城市空间的活动规律及其时空变化,可以更好地理解群体活动与城市空间的相互作用,为人类行为学研究、城市规划布局、公共交通优化等领域提供辅助决策信息。传统的群体活动分析数据主要依靠收集出行调查问卷获得,然而此种依赖人工的方式样本量少,搜集时间长,耗时耗力,因此亟需可靠、易取的时空数据来快速捕捉群体活动的特征。
随着信息通信技术(Information Communication Technology,ICT)和泛在感知技术(Ubiquitous Sensing Technology)的飞速发展,使实时、高效记录人类时空位置信息成为可能,产生了海量、多源的人类时空活动数据。这些海量数据弥补了传统方式的不足,具有高精度、高频次、高效率、低成本等特点。
由于智能手机的广泛使用,移动运营商通过通讯信号将基站尺度的时空位置记录下来,基于智能手机的移动定位数据为群体时空间活动特征研究提供了新的解决途径。
目前,基于手机定位数据的时空间活动识别主要从个体和群体2个层面出发。个体层面的识别主要根据一定的时空规律和先验信息对时空轨迹链中不同的位置进行语义活动标记;群体层面则从时空活动位置与土地利用的空间关系出发,在空间集聚的尺度上来推断活动的类型。这些研究都从不同角度探究了群体活动特征与城市空间的相互作用的关系,但是由于手机数据缺乏语义信息(类别、位置持续时间等),活动轨迹空间尺度不一,活动特征难以提取,因而基于大数据环境下的群体活动精准识别与分析仍存在巨大的挑战。
本文利用深圳市海量手机定位数据,通过识别用户停留位置和停·留活动、标记活动语义信息,分析用户的停留点和停留活动的分布差异,研究群体活动的时空分布模式,探讨人群活动模式的多样分布特征。这对于深入理解城市空间中不同类型活动的时空分布的多样性和差异性具有重要意义,对于辅助城市交通优化和城市规划具有参考价值。
研究区概况及数据源
本文选择深圳作为研究区。深圳位于广东省南部,南临香港,北接东莞、惠州,总面积1996 km2。如图1所示,深圳市下辖8个行政区,其中罗湖、福田、南山原属经济特区,2010年之后特区范围扩大到整个辖区。截止2015年末常住人口约137.891万人,人口密度每平方公里达到10 000人,位列全国第一,流动人口总数在全国最多。因为历史发展的原因,深圳的南北区域经济社会发展差异大,人口分布不均匀,原特区部分(罗湖、福田、南山)在科技、金融、教育等领域高度发达,人口分布集中,旧称为“关内”,而其他行政区被称为“关外”,其制造业较为发达,人口分布较少。随着深圳城市化加速和人口的持续扩张,关内关外差异在逐渐缩小,跨区域群体出行逐渐增多,人群活动变得更为复杂。
研究区域
本文采用2012年3月某一工作日约1000万用户的移动手机定位数据,移动运营商以1 h左右的采样间隔通过移动基站记录手机用户通信的基站编号,获取用户所在位置。数据由移动运营商进行了匿名化处理,以保护用户隐私。通过对每一条数据记录的时间进行小时整数化处理,得到包含用户id、小时数、所在基站id、基站位置经度、基站位置纬度等属性的数据序列,如表1所示。